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<§) Verfahren zum Betrlob einer Datenverarbeitungseinrichtung 

@ Verfahren zum Betrieb einer Datertverarbeitungseinrich- 
tung mit programmier- und konfigurierbarer Zellstruktur, 
wobei die Datenverarbeitungseinrichtung eine Zellmatrix a us 
einer Vletzahl orthogonal zueinander angeordnetar, homo- 
gen strukturierter Zellen, welche in Ihrer Funktlon und 
Vernetzung durch eine Ladelogik frei prog rammie roar sind, 
enthatt dadurch gekennzeichnet, dafi 

a) ein Konfigurationsprogramm, bestehend aus einer Folge 
von Ladelogik- Befehlen, die jeweils die Funktion und Vernet- 
zung der einzelnen Zellen angeben, so dafc sich aus einer Tail 
folge eine spezielle Konfiguration mit spezieHerfen) Anwen- 
dung(en) ergibt, vorhanden 1st auf das die Ladelogik (30) 
Zugriff hat (Fig. 3, Fig. 8, Fig. 14. Fig. 15) und das von ihr 
ausgefuhrt wlrd, 

b) zunachst durch eine bestimmte Anzahl von Ladeiogik-Be- 
fehlen eine Konfiguration (Fig. 20b) mit speziellerfen) An- 
wendung(en), mitteis.der Ladelogik (30) zu Beginn ate 
Startkonfiguration in der Zell-Matrbc (Fig. 2, Rg.3) einge- 
steflt wird, 

c) durch eine Statemachine (45) oder einen Komparator (48) 
die Beendigung der Durchfuhrung einer Anwendung einer 
Oder mehrerer Zellen erkannt wird, 

d) durch die Erkennung eine Rflckmeldung an die Ladelogik 
(30) erfolgt, die die Programmabarbettung das Konfigura- 
tionsprogramms mit einer anderen TeHfolge (Fig. 21b, 
Fig. 22b) fortsetzt welche nur Zellen umkonfiguriert, also 
neu erstellt die die Durchfuhrung ihrer Funktion fur die 
aktuelle Anwendung bereits beendet ha ban oder nicht 
bonotigt werden, so daS die Absrbeitung der Datanstromo 
der an der aktuellen Konfiguration noch betelligten, parallel 
(z*B. Register 41, 42) . oder gepipe fined (z.B. Fig. 22a, 
Summterer 141 und Muttipliziefer 149) arfaeitenden Zellen, 
die stch noch in der Durchfuhrung ihrer Anwendung befin- 
den, nicht gestdrt wird. 
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Beschreibung weils logisdi gleicher und strukturell identisch angeord- 

neter Zellen gezeigt, sowie dessen interne Busstruktur, 
Die vorliegende Erfindung bezieht sich auf Verf ahren die zur Erleichterung der Programmierung auBerst ho- 
zum Betrieb einer Datenverait^itungseinrichtung, d h. mogen ist. GrundsStzIich ist es denkbar innerhalb eines 
einer Hardwareeinheit zur logischen und arithmetic 5 DatenfluBprozessors Zellen mit verschiedenen Zellogi- 
schen Manipulation (VerknQpfung) von in binarer Form ken und Zellstrukturen unterzubringen, um so die Lei- 
vortegenden Daten (InfonnauonenX stungsfahigkeit zu erhohen, indem zum Beispiel fur 

Nach dem Stand der Technik sind gewdhnliche Mi- Speicheransteuenmgen(Busmterface) andere Zellen als 
kroprozessoren (z. R Intel 80 x 86) bereits bekannt We- fur arithmetische Operationen (Arithmetisch/logische 
se sind aus fest vorgegebenen Einheiten ausgestaltet to Einhehen (ALUs) existieren. Insbesondere kann fOr neu- 
und verarbeiten Programme durch das Auskodieren ronale Netze eine gewisse Spezialisierung von Vorteil 
von Bef ehlen (Microcode) und dadurch bestimmte Regi- sein. Den Zellen ist eine Ladelogik zugeordnet, Ober die 
stermanipulationen. die Zellen je fur sich und gegebenenfaBs gruppenweise 

Ebenfalls bekannt sind sogenannte FPGAs (z. B. aus in sogenannte MACROs (Menge von Zellen, welche zu- 
US-Patent 4,870,302) die zum Aufbau von komplexen 15 sammen eine definierte Aufgabe Idsen) zusammenge- 
logischen Strukturen verwendet werden. Auf der fafit so programmierbar sind, daB einerseits beliebige 
Grundlage dieser Bausteine lassen sich Rechenwerke logische Funktionen, andererseits aber auch die Ver- 
wie Addierer, Multiphzierer, etc. innerhalb des Baustei- knupfung der Zellen untereinander in weiten Bereichen 
nes fur die Durchfuhrung einer bestimmten Funktion verifizierbar sind. Dies wird erreicht indem jeder einzel- 
oder Aufgabe konfigurieren. Durch die direkte Imple- 20 nen Zelle ein gewisser Speicherplatz zur VerfQgung 
mentierung einer Funktion in die entsprechenden Lo- stent, in dem die Konfigurationsdaten abgelegt sind. An- 
gikbausteine konnen FPGAs Funktionen oftmals hand dieser Daten werden Multiplexer oder Transisto- 
schneller ausfuhren als Mikroprozessoren. Obwohl die ren in der Zelle beschaltet um die jeweiiige Zellfunktion 
bekannten Bausteine aufgrund ihrer SRAM-Architek- zugewahrleisten(sieheFig. 12). 
tur bereits umkonfiguriert werden konnen, existiert kern 25 Mit anderen als im Patentanspruch 1 gebrauchten 
Mechanismus, um die Umkonfiguration schnell und dy- Worten besteht der Kern der vorliegenden Erfindung 
namisch wahrend der Laufzeit durchfuhren zu konnen, darin, eine Methode fur einen DatenfluBprozessor vor- 
insbesondere, wenn nur Teilbereiche des Bausteines mit zuschlagen, der zellular aufgebaut ist und dessen Zellen 
einer neuen Funktion konfiguriert werden sollen, wan- uber eine Ladelogik im arithmetisch-logischen Sinne 
rend andere Teile des Bausteines ihre Aufgabe fortset- 30 quasi beliebig neu konfiguriert werden konnen. Dabei 
zen. Durch die fehlende Interaktion zwischen einer kon- ist es von SuBerster Notwendigkeit, daB die betreffen- 
figurierenden Einheit und dem FPGA an sich, scheiden den Zellen einzeln und obne Beeinflussung der Qbrigen 
die Bausteine als funktional vollwertiger Ersatz fur Mi- Zellen oder gar einer StiUegung des gesamten Bausteins 
kroprozessoren aus. umkonfiguriert werden konnen. Ein DatenfluBprozes- 

Die der vorliegenden Erfindung zugrunde liegende 35 sor gemaB dem vorliegenden Verfahren kann so wah- 
Aufgabe besteht darin, ein Verfahren zum Betrieb einer rend eines ersten Arbeitszyklusses als Addierer und 
Datenverari>eitungseinrichtung mit programmierbarer wahrend eines spateren Arbeitszyklusses als Multipli- 
ed konfigurierbarer Zell-Struktur — wobei eine Zelle zierer "programmierf/genutzt werden, wobei die An- 
als ein logisches Schaltelement ahnlich US 4370302 zahl der fur die Addition beziehungsweise die Multipli- 
(LR) oder eine besonders ausgestaltete Recheneinheit 40 kation erforderhchen Zellen durchaus unterschiedlich 
(ALU) definiert ist — bereitzustellen, das eine hohere sein kdnncn. Dabei bleibt die Piazierung der bereits 
Parallelitat der Verarbeitung und eine flexiblere Verar- geladenen und wahrend des Umladeprozesses nicht tan- 
beitung von Daten gewahrieistet gierten MACROs erhalten; der Ladelogik beziehungs- 

Dabei wird beschrieben, wie Bausteine, die aus einer weise dem Compiler obb'egt es, das neu zu ladende MA- 
Vielzahl von zwei- oder mehrdimensionalen ZeUstruk- 45 CRO innerhalb der freien Zellen zu partitionieren (<L h. 
turen aufgebaut sind, schnell und effizient nach Ablauf das zu ladende MACRO so zu zerlegen, daB es sich 
eines Arbeitsschrittes oder Teuarbertsschrittes, durch optimal einfagen laBt). Die Ablaufsteuerung des Pro- 
Interaktion zwischen dem Baustein und einer konfigu- gramms wird dabei von der Ladelogik ubernommen, 
rierenden Enheit, dynamisch neu konfiguriert werden, indem sie gemaB dem momentan ausgefahrten Pro- 
ohneEnfluBaufnochaWaufendeArbeitsschrittezuha- 50 grammabschnitt die entsprechenden MACROs in den 
ben. Die Notwendigkeit einer Umkonfiguration, bzw. Baustein ladt, wobei der Ladevorgang von der spacer 
das Ende eines Arbeitsschrittes, kann gemaB dieses Ver- beschriebenen Synchronisationslogik mitgesteuert 
f aniens automatisch erkannt werdea Dadurch kann auf wird, indem sie den Zeitpunkt des Umladens fesdegt 
Grundlage dieses Verfahrens ein vollwertiger Ersatz fur Daher entspricht ein DFP gemaB dem beschriebenem 
Mikroprozessoren geschaffen werden. 55 Verfahren nicht der bekannten von-Neumann-Archi- 

Ein Vorteil der vorliegenden Erfindung liegt darin, tektur, da die Daten- und Programmspeicher getrennt 
daB die beschriebene Methode eine uber einen weiten sind. Dies bedeutet jedoch gleichzeitig eine hdhere Si- 
Raum skalierbare Parallelitat ermdglicht Hierbei wird cherheit, da fehlerhafte Programme keinen CODE, son- 
eine Basis zum schnellen und flexiblen Aufbau von zum dern lediglich DATEN zerstoren konnen. 
Beispiel neuronalen Strukturen geschaffen, wie sie bis 60 Um dem DatenfluBprozessor eine arbeitsfahige 
dato lediglich mit erheblichem Aufwand durch Software Struktur zu geben, werden einige Zellen, und zwar unter 
simuliert werden kdnnen. anderem die Eingabe-Musgabefunktionen (I/O) und 

Diese Aufgabe wird durch die im Patentanspruch I Speichennanagementfunktionen (I/O) vor dem Laden 
angegebenen Merkmale beziehungsweise Verfahren- der Programme geladen und bleiben fur gewohnlich 
schritte gelost Zur Verdeutlichung der Verfahrens- 65 wahrend der gesamten Laufzeit konstant. 
schritte wird beispieisweise ein integrierter Schaltkreis Dies ist erforderlkh um den DatenfluBprozessor an 
(Chip) mit einer Vielzahl insbesondere orthogonal zu- seine Hardwareumgebung anzupassen. Die ubrigen Zel- 
einander angeordneter Zellen mit je einer Mehrzahl je- len werden zu sogenannten MACROs zusammengcfaBt 
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und konnen wahrend der Laufzeit nahezu beliebig und 
ohne Beeinflussung von Nachbarzellen oder anderen 
MACROs umkonfiguriert werdea Dazu sind die Zellen 
einzein und direkt adressierbar. 

Um die Umstrukturierung (das Umladen/Umkonfigu- 5 
rieren) der Zeflen oder MACROs mit der Ladelogik zu 
synchronisieren, kann — wo notwendig, da nur Umgela- 
den werden darf, wenn die MACROs mit ihrer alten 
Tatigkeit fertig sind — eine Synchronisationsschaltung 
als MACRO auf dem DatenfluBprozessor unterge- 10 
bracht werden, die die entsprechenden Signale an die 
Ladelogik absendet Hierzu kann eventuefl eine Modifi- 
kation der gewdhnlichen MACROs von N6ten sein, da 
diese dann der Synchronisations-Schaltung Zustandsin- 
formationen zur VerfugungsteUenmussea 15 

Diese Zustandsinformationen signalisieren der Syn- 
chronisationslogik fur gewdhnlich, daB einzelne MA- 
CROS ihre Aufgabe erledigt haben, was aus program- 
miertechnischer Sicht zum Beispiel die Terminiening 
einer Prozedur oder das Erreichen der Tenninierungs- 20 
bedingung einer Schleife bedeuten kann. DJl das Pro* 
gramm wird an einer anderen Stelle fortgesetzt und die 
die Zustandsinformation absendenden MACROs kon- 
nen umgeladen werden. Zudem kann es von Interesse 
sein, daB die MACROs in einer bestimmten Reihenfolge 25 
umgeladen werden. Hierzu kann eine Wertung der ein- 
zelnen Zustandsinformationen durch eine Logik (zum 
Beispiel einen (Prioritats- Arbiter) erfolgea Eine derarti- 
ge — einfache — Logik ist in Fig* 19 gezeichnet Die 
Logik besitzt sieben Eingangssignale durch die die sie- 30 
ben MACROs ihre Zustandsinformation abgebea In 
diesem Fall soQ 0 fur "in Arbeit" und 1 fur n f ertig^ stehea 
Die Logik besitzt drei Ausgangssignale, die an die Lade- 
logik gefuhrt werden, wobei der Zustand 000 als Ruhe- 
zustand gflt Liegt ein Signal an einem der sieben Ein- 35 
gange an, so findet eine Dezimal-Binar-LJmsetzung 
statt, so wird zum Beispiel SynoS als 1 10 dargesteflt, was 
der Ladelogik anzeigt, daB das MACRO, welches Sync6 
bedient, seine Aufgabe beendet hat Liegen gleichzeitig 
mehrere Zustandsinformationen am Eingang an, so gibt 40 
die Synchronisationsschaltung das Signal mit der hoch- 
sten Prioritat an die Ladelogik weiter; liegen zum Bei- 
spiel SyncO, Sync4 und Sync6 an, so reicht die Synchro- 
mstaions-Schaltung zunachst Sync6 an die Ladelogik 
weiter. Nachdem die entsprechenden MACROs umge- 45 
laden sind und somit SynoS nicht mehr anliegt wird 
Sync4 weitergeleitet usw. Zur Verdeutlichung dieses 
Prinzips kann zum Beispiel der Standard-TTL- Baustein 
74148 in Betracht gezogen werdea 

Ober die Ladelogik kann der DatenfluBprozessor je- 50 
weils optimal und gegeSenenf alls dynamisch auf eine zu 
lasende Aufgabe eingestellt werden. Damit ist zum Bei- 
spiel der groBe Vorteil verbunden, daB neue Normen 
oder dergleichen einzig und allein durch Umladen des 
DatenfluBprozessors umgesetzt werden konnen und 55 
nicht — wie bisher — einen Austausch mit entsprechen- 
dem Anf ail von Hektronikschrott bedingea 

Die DatenfluBprozessoren sind untereinander kaska- 
dierbar, was zu einer beinahe beliebigen Erhohung des 
Parallelisierungsgrades, der Rechenleistung, so wie der go 
NetzgroBe in neuronalen Netzen fuhrt Besonders wich- 
tig ist hier eine klare homogene Verbindung der Zellen 
mit den Ein-/Ausgangs-Pins (IO-Pins) der DatenfluB- 
prozessoren, um mdgiichst kerne Einschrankungen auf 
die Programme zu haben. 65 

In Fig. 4 ist zum Beispiel die Kaskadierung von vier 
DFPs gezeigt Sie erscheinen der Umgebung wie ein 
groBer homogener Baustein (Fig. 5). Prinzipiell sind da- 



mit zwei Kaskadierungsmethoden denkban 

a) Nur die lokalen Verbindungen zwischen den Zel- 
len werden herausgefuhrt, was hn vorliegenden 
Beispiel zwei lO-Pins pro Kantenzelle und vier IO- 
Pins pro Eckzelle bedeutet Allerdings hat der 
Compiler/Programmierer zu beachten, daB die glo- 
balen Verbindungen nicht herausgefuhrt werden, 
wodurch die Kaskadierung nicht vollstandig homo* 
gen ist (Globale Verbindungen zwischen mehreren 
Zellen, fur gewdhnlich zwischen einer komptetten 
Zellenreihe oder -spake — siehe Fig. 1 — , lokale 
Verbindungen existieren nur zwischen zwei Zellen). 
Fig. 6a zeigt den moglichen Aufbau innerhalb eines 
DFPs, Fig. 7a zeigt die daraus resultierende Kaska- 
dierung von mehreren DFPs (drei gezeichnet). 

b) Die lokalen und globalen Verbindungen werden 
herausgefuhrt was die Anzahl der bendtigten Trei- 
ber/IO-Pins und Leitungen drastisch erhoht, in un- 
serem Beispiel (Fig. 6b) auf sechs IO-Pins pro Kan- 
tenzelle und zwolf IO-Pins pro Eckzelle. Dadurch 
ist eine vollstandige Homogenitat bei der Kaska- 
dierung gegeben (Fig. 7b). 

Da die globalen Verbindungen insbesondere bei Ver- 
wendung der Kaskadierungstechnik b) sehr lang wer- 
den konnen, kann der unangenehme Effekt auftreten, 
daB die Zahi der globalen Verbindungen nicht ausreicht, 
da bekanntlich jede Verbindung nur von einem Signal 
genutzt werden kann. Um diesen Effekt zu niinimieren, 
kann nach einer gewissen Lange der globalen Verbin- 
dungen ein Treiber eingeschleift werden. Der Treiber 
hat zum einen eine Verstarkung des Signal s zur Aufga- 
be, die bei langen Strecken und entsprechend hohen 
Lasten, unbedingt erforderlich ist; zum anderen kann 
der Treiber in Tristate gehen und damit das Signal un- 
terbrechea Dadurch konnen die Abschnitte links und 
rechts, beziehungsweise oberhalb und unterhalb des 
Treibers von verschiedenen Signalen genutzt werden, 
sofem der Treiber in Tristate ist, ansonsten wird ein 
Signal durchgeschleift Wichtig ist hierbei, daB die Trei- 
ber der einzelnen globalen Leitungen auch einzein an- 
gesteuert werden konnen, d. h. ein globales Signal kann 
unterbrochen sein, das Nachbarsignal ist jedoch durch- 
geschleift Somit konnen auf einer globalen Verbindung 
durchaus abschnittweise verschiedene Signale aniiegen, 
wahrend die globale Nachbarverbindung tatsachlich 
global von ein und demselben Signal verwendet wird 
(vergleicheFig. 18). 

Zur besseren Kommunikation zwischen den Daten- 
fluBprozessoren und der Ladelogik konnen sogenannte 
Shared-Memories eingesetzt werdea So konnen zum 
Beispiel Programme von einer Festplatte, die im IO-Be- 
reich eines DatenfluBprozessors liegt zur Ladelogik 
durchgereicht werden, indem die DatenfluBprozessoren 
die Daten von der Platte in den Shared-Memory schrei- 
ben und die Ladelogik sie dort abholt Dies ist besonders 
wichtig, da hier, wie bereits erwahnt, keine von-Neu- 
mann- sondern eine Harvardarchitektur vorliegt Eben- 
so sind die Shared-Memories von VorteQ, wenn Kon- 
stanten, die im Programm — das im Speicherbereich der 
Ladelogik liegt — defmiert sind, mit Daten — die im 
Speicherbetrieb der DatenfluBprozessoren liegen — 
verkmipft werden sollea 

Weiterbildungen der vorstehend defmierten und um- 
schriebenen Erflndung sind Gegenstand der Unteran- 
spruche. 

Eine besondere Verwendung eines DatenfluBprozes- 
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sors gemaB dera beschriebenem Verfahrens ist darin zu 
sehen, da6 er in Verbindung mit geeigneten Ein-/Ausga- 
be-Einheiten einerseits und einem Speicher andererseits 
die Basis fur einen kompletten (komplexen) Rechner 
bilden kann. Dabei kann ein GroBteil der IO-Funktio- 5 
nen als MACROs auf dem DatenfluBprozessor imple- 
memiert werden und es brauchen raomentan ledigiich 
Speziaibausteine (Ethernet-Treiber, VRAMS. . .) extern 
zugefugt zu werdea Bei einer Normanderung oder Ver- 
besserung muB dann wie bereits angedeutet nur das 10 
MACRO softwareseitig angepaBt werden; ein Eingriff 
in die Hardware ist nicht notwendig. Es bietet sich hier 
an, einen IO{Eingabe-/Ausgabe-) Stecker festzulegen, 
uber welchen dann die Zusatzbausteine angeschlossen 
werden kdnnen. 15 

Fig. 16 zeigt den stark vereinfachten Aufbau eines 
heute ublichen Rechners. Durch den Einsatz eines DFP- 
Bausteins konnen erhebHche TeUe eingespart werden 
(Fig. 17), wobei die entsprechenden herkdmmlicben 
Baugruppen (CPU, Speicherverwaltung, SCSI-, Tasta- 20 
tur- und Videointerface, sowie der paraflelen und seriel- 
len Schnittsteilen) als MACROs in die kaskadierten 
DFPs abgelegt werden. Nur die durch einen DFP nicht 
nachbildbaren Teile wie Speicher und Lehungstreiber 
mit nicht TTL-Pegeln oder fur hohe Lasten mflssen ex- 25 
tern zugeschaltet werden. Durch die Verwendung des 
DFPs ist eine gunstige Produktion gegeben, da ein und 
derselbe Baustein sehr haufig verwendet wird, das Lay- 
out der Platine ist durch die homogene Vernetzung ent- 
sprechend einfach. Zudem wird der Aufbau des Rech- 30 
ners durch die Ladelogik bestimmt, die hier fur gewohn- 
lich nur zu Beginn der Verarbeitung (nach einem Reset) 
das DFP-Array ladt, wodurch eine gunstige Fehlerkor- 
rektur- und Erweiterungsmdglichkeit gegeben ist Ein 
derartiger Rechner kann insbesondere mehrere ver- 35 
schiedene Rechnerstrukturen simulieren, indem einfach 
der Aufbau des zu simulierenden Rechners in das DFP- 
Array geladen wird Zu bemerken ist, daB hierbei der 
DFP nicht in seiner Funktion als DFP arbeitet sondern 
ledigiich ein hochkomplexes und frei programmierbares 40 
Zellarray zur Verfugung stellt, sich hierbei jedoch von 
herkommlichen Bausteinen in seiner besonderen guten 
Kaskadierbarkeit unterscheidet 

Ein weiteres Einsatzgebiet eines solchen Bausteins ist 
der Aufbau groBer neuronaler Netze. Sein besonderer 45 
Vorzug iiegt hierbei in seiner hohen Gatterdichte, seiner 
ausgezeichneten Kaskadierbarkeit, sowie seiner Homo- 
genitat Ein Lemvorgang, der eine Anderung einzelner 
axiomatischer Verbindungen beziehungsweise einzel- 
ner Zellfunktionen beinhaltet ist auf ublichen Baustei- 50 
nen ebenso schlecht durchfuhrbar, wie der Aufbau gro- 
Ber homogener und gleichzeitig flexibler Zellstrukturen. 
Die dynamische Umkonfigurierbarkeit ermdglicht erst- 
maiig die optimale Simulation von Lernvorgangen. 

Die vorliegende Erfuidung wird im folgenden anhand 55 
der weiteren Figuren naher erlauterL Insgesamt zeigen 

Fig. 1 ein aus vier Zellen bestehendes unprogram- 
miertes SUBMACRO X (analog einem 1-Bit-Addierer 
gemaB Fig. 12 beziehungsweise Fig. 13) mit den erfor- 
derlichen Leitungsanschlussen; 60 

Fig. 2 einen Teilausschnitt eines integrierten Schalt- 
kreises (Chip) mit einer Vielzahl von Zellen und einem 
separierten SUBMACRO X gemaB Fig. 1 ; 

Fig. 3 einen integrierten Schaltkreis (Qup) mit einer 
Orthogonalstruktur einer quasi beliebigen Vielzahl von 65 
Zellen und einer extern zugeordneten Ladelogik; 

Fig. 4 ale Kaskadierung von vier DFPs, wobei die 
Verbindung zwischen den IO-Pins nur schematisch dar- 



gesteDt sind (tatsachlich bedeutet eine gezeichnete Ver- 
bindung eine Mehrzahl von Leitungen); 

Fig. 5 die durch die Kaskadierung erreichte Homoge- 
nitat; 

Fig. 6a die Struktur der E/A-Zellen, wobei die globa- 
len Verbindungen nicht herausgefuhrt werden, 

Fig. 6b die Struktur der E/A-Zellen, jedoch mit her- 
ausgefuhrten globalen Verbindungen; 

Fig. 7a die aus Fig. 6a resulderende Kaskadierung, 
wobei eine EckzeQe, sowie die zwei mit ihr kommunizie- 
renden Treiberzellen der kaskadierten Bausteine (ver- 
gleiche hierzu Fig. 4) gezeichnet sind; 

Fig. 7b die aus Fig. 6b resultierende Kaskadierung, 
wobei eine Eckzelle, sowie die zwei mit ihr kommunizie- 
renden Treiberzellen der kaskadierten Bausteine (ver- 
gleiche hierzu Fig. 4) gezeichnet sind; 

Fig. 8 einen bei spiel haften Aufbau einer Zelle mit 
Multiplexern zur Auswahl der jeweihgen logischen Bau- 
steine; 

Fig. 9 ein Schaltsymbol fur einen &-Bit-Addierer ; 
Fig. 10 ein Schaltsymbol fur einen aus acht 1-Bit-Ad- 
dierern bestehenden 8-Bit- Addierer nach Fig. 9; 

Fig. 11 eine logische Struktur eines 1-Bit-Addierers 
entsprechendFig. 10; 

Fig. 12 eine Zeflenstruktur des 1-Bit-Addierers ent- 
sprechend Fig. 11; 

Fig. 13 einen der Zellenstruktur nach Fig. 9 entspre- 
chend aufgebauten 8-Bit- Addierer; 

Fig. 14 ein erstes Ausfuhrungsbeispiel einer Mehrzahl 
miteinander zu einem Rechenwerk gekoppelter inte- 
grierter Schaltkreise (DatenfluBprozessor) nach Fig. 3; 

Fig. 15 ein zweites Ausfiihrungsbeispiel einer Mehr- 
zahl miteinander zu einem Rechenwerk gekoppelter in- 
tegrierter Schaltkreise (DatenfluBprozessor) nach 
Fig. 3; 

Fig. 16 den stark schematisierten Aufbau eines her- 
kdmmlichen Rechners; 

Fig. 17 den moglichen Aufbau desselben Rechners 
mit Hilfe eines Arrays aus kaskadierten DFPs; 

Fig. 18 einen Ausschnitt mit eingezeichneten (Lei- 
tungs-) Treibern eines DFPs. 

Fig. 19 eine zum Beispiel mit einem Standard-TTL- 
Baustein 74148 ausgefuhrte Synchronisationslogik; 

Fig. 20a, b, c ein Aushlhrungsbeispiel eines MACRO 
zur Addition zweier Zahlenreihen; 

Fig. 21a eine Multiplikationsschaltung (vergleiche 
Fig. 20); 

Fig. 21b die interne Struktur des DFPs nach dem La- 
den (vergleiche Fig. 20b); 

Fig. 21c die Arbeitsweise des DFPs im Speicher, so- 
wie die Zust&nde der Zahler 47, 49; 

Fig. 22a, b, c eine Kaskadenschaltung, wobei der Ad- 
dierer aus Fig. 20 und der Multiplizierer aus Fig. 21 zur 
Steigerung der Rechenleistung hintereinander geschal- 
tetsmd; 

In Fig. 9 ist ein Schaltsymbol eines 8-Bit- Addierers dar- 
gestellt Das Schaltsymbol besteht aus einem quadrati- 
schen Baustein 1 mit acht Eingangen A 0.. J fur ein 
erstes Datenwort A und acht Eingangen B 0. . .7 fur ein 
zweites (zu addierendes) Datenwort B. Die jeweils acht 
Eingange Ai, Bi (i — 0. . .7) werden erganzt durch einen 
weiteren Eingang Oein Qber den dem Baustein 1 gege- 
benenf alls ein Obertrag zugeleitet wird. Der Baustein 1 
hat funktions- und bestimmungsgemaB acht Ausgange S 
0. . J fur binaren Summanden und einen weiteren Aus- 
gang Oaus fur den gegebenenfalls bestehenden Ober- 
trag. 

Das in Fig. 9 dargestellte Schaltsymbol ist in Fig. 10 



DE 44 16 881 C2 

7 8 

ais Anordnung sogenannter SUBMACROS dargestellt risch separiert das letztlich ais aus vier einem t-Bit-Ad- 

Diese SUBMACROS 2 bestehen je aus einem 1 -Bit- Ad- dierer entsprechend programmierten ZeDen (10 gemaB 

dierer 3 mit je einem Eingang fur <fie entsprechenden Fig. 12) bestehende Untereinheit zu betrachten ist 

Bits des Datenworts und einem weiteren Eingang fur ein Das in Fig. 13 separierte SUBMACRO "X* ist in 

Obertragsbit Die 1-Bit-Addierer 3 weisen daruberfain- 5 Fig. 1 ais Teil eines integrierten Scbaltkreises (Chip) 20 

aus einen Ausgang fur den Summanden und einen Aus- gemeinsam mit Leitungs- und Datenanschlussen darge- 

gang fur den Obertrag Oaus auf. stellt Das SUBMACRO "X" besteht aus den vier Zellen 

In Fig. 1 1 ist die binare Logik eines 1-Bit-Addierers 10 die entsprechend der orthogonalen Struktur je Seite 

beziehungsweise eines SUBMACROS 3 nach Fig. 10 vier Datenanschlusse (also insgesamt sechzehn Daten- 

dargesteflL Analog zu Fig. 10 weist diese Schaltlogik je 10 anschlQsse je Zelle) aufweisen. Die Datenanschlusse 

einen Eingang Ai, Bi fur die konjugierten Bits der zu verbindenjeweilsbenachbarte Zellen, so daB ersichtlich 

verknfipfenden Daten auf; ferner ist em Eingang Oein wird, wie beispielsweise eine Dateneinheit von Zelle zu 

fur den Obertrag vorgesehen. Diese Bits werden den Zelle durchgeschleust wird. Die Ansteuerung der Zellen 

dargestellten Verbindungen beziehungsweise Verknup- 10 erfolgt einerseits fiber sogenannte lokale Steuerun- 

fungen entsprechend in zwei ODER-Gliedern 5 und drei 15 gen, das sind lokale Leitungen, die mit alien Zellen ver- 

NAND-Gliedern 6 verknupft, so daB am Ausgangsan- bunden sind, und andererseits fiber sogenannte globale 

schluB Si und am Ausgang fur den Obertrag Oaus die Leitungen, d. h. Leitungen, die fiber den gesamten inte- 

einem Volladdierer entsprechenden Verknupfungser- grierten Schaltkreis (Chip) 20 gefuhrt sind 

gebnisse(Si,Oaus)anstehen. In Fig. 2 ist ein vergroBerter Ausschnitt eines inte- 

Auf der GroncQage logisch und strukturell identischer 20 grierten Schaltkreises 20 dargestellt, der mit einem or- 

Zellen 10, deren einzelne logische Bausteine der auszu- thogonalen Raster von Zellen 10 belegt ist Wie in Fig. 2 

fuhrenden Verknfipfungsfunktion entsprechend ver- angedeutet kann so zum Beispiel eine Gruppe von vier 

schaltet werden, wird der 8-bit Addierer 2 in geeigneter ZeUen 10 ais SUBMACRO "X" ausgewahlt und dem 

Weise in die ZeUstruktur implementiert Der Vorgang 1-Bit-Addierer entsprechend Fig. 12 gemaB program- 

geschieht mittels der noch zu beschreibenden Ladelo- 25 miert beziehungsweise konfiguriert werden. 

gik. GemaB der in Kg. 12 gezeigten, von der Schaltlogik Ein voUstandiger integrierter Schaltkreis gemaB dem 

nach Fig. 1 1 abgeleiteten Verknupfungslogik fur einen beschriebenen Verf ahren (DFP) 20 ist beispielsweise in 

1-Bit-Addierer sind je zwei Zellen 10.1, 10.2 bezuglich Kg. 3 dargestellt Dieser integrierte Schaltkreis 20 be- 

der logischen Bausteine insoweit gleich, daB jeweils ein steht aus einer Vielzahl im orthogonalen Raster ange- 

ODER-Glied 5 und ein NAND-Glied 6 aktiviert sind. 30 ordneter Zellen 10 und weist an seinen AuBenkanten 

Eine dritte Zelle 103 wird nur ais Leitungszelle (Leiter- eine entsprechende Anzahl von Leitungsanschlfissen 

bahnzefle) benutzt und die vierte Zelle 10.4 ist bezuglich (Pins) auf, uber die Signale, insbesondere Ansteuersi- 

des dritten NAND-GIiedes 6 aktiv geschaltet Das aus gnale und Daten zugefuhrt und weitergeieitet werden 

den vier Zellen 10.1. ... 10^ bestehende SUBMACRO 2 kdnnen. In Fig. 3 ist wiederum das SUBMACRO *X* 

steht somitstellvertretend fur einen l-Bit-Addierer, d. h. 35 gemaB Fig. 13/Fig. 1 abgegrenzt; darfiberhinaus sind 

ein 1-Bit-Addierer einer Datenverarbeitungseinrich- auch weitere SUBMACROS separiert, die speziflschen 

tung nach Art der vorliegenden Erfindung kann fiber Funktionen und Vernetzungen entsprechend zu Unte- 

vier entsprechend programmierte (konfigurierte) Zellen reinheiten zusammengefaBt sind. Dem integrierten 

10.1 10.4 verifiziert werden. (Der Vollstandigkeit Schaltkreis (Chip) 20 ist eine Ladelogik 30 zugeordnet 

halber soil angemerkt werden, daB die einzelnen Zellen 40 beziehungsweise ubergeordnet fiber die der integrierte 
ein erheblich umfangreicheres Netzwerk von logischen Schaltkreis 20 programmiert und konfiguriert wird. Die 
Bausteinen, sprich Verknupfungsgliedern, und Invertern Ladelogik 30 teflt letztlich dem integrierten Schaltkreis 
aufweist, die jeweils dem aktuellen Bef ehl der Ladelogik 20 mit wie er arithmetisch-logisch zu arbeiten hat 
zufolge aktiv geschaltet werden konnen. Neben den io- Anhand von Fig. 14 beziehungsweise Fig. 15 soil im 
gischen Bausteinen ist auch ein dichtes Netz von Ver- 45 folgenden eine Rechnerstruktur beschrieben werden, 
bindungsleitungen zwischen den jeweils benachbarten die auf den im vorstehenden defmierten und erliuterten 
Bausteinen und zum Aufbau von zeilen- und spaltenwei- integrierten Schaltkreis 20 aufbaut 
sen Busstrukturen zur Datenfibertragung andererseits GemaB dem in Fig. 14 dargestellten ersten Ausffih- 
vorgesehen, so daB fiber eine entsprechende Program- rungsbeispiel ist — analog zur Anordnung der Zellen — 
mierung seitens der Ladelogik quasi beliebige logische 50 im Orthogonalraster eine Mehrzahl von integrierten 
Verknupfungsstnikturen implementiert werden kon- Schaltkreisen 20 angeordnet deren jeweils benachbarte 
nen j. fiber lokale BUS-Leitungen 21 miteinander gekoppelt 
Der Vollstandigkeit halber ist in Fig. 13 der ZeUen- beziehungsweise vernetzt sind. Die - beispielsweise 
aufbau eines 8-Bit-Addierers in seiner Gesamtheit dar- aus sechzehn integrierten Schaltkreisen 20 bestehende 
gestellt Die in Fig. 13 gezeigte Struktur entspricht inso- 55 - Rechnerstruktur weist Ein-/Ausgangsleitungen IO 
weit der nach Fig. 10, wobei die in Fig. 10 symbolisch ais auf, fiber die der Rechner quasi mit der AuBenwelt in 
SUBMACROS 3 dargestellten 1-Bit-Addierer jeweils Verbindung steht d. h. korrespondiert Der Rechner ge- 
durch eine vier-zellige Einheit 10.1. . . . 10.4 ersetzt sind maB Fig. 14 weist ferner einen Speicher 22 auf, der dem 
Bezogen auf einen DatenfluBprozessor gemaB des be- dargestellten Ausfuhrungsbeispiel entsprechend aus 
s(mriebenenVerfahrensbedeutetmes,daflzweiunddrei- eo zwei separierten Speichern, zusammengesetzt aus je- 
Big Zellen der zur Verffigung stehenden Gesamtheit weik RAM, ROM sowie einem Dual-Ported RAM ais 
von Zellen einer zellular mit logisch identischem Layout shared memory zu der Ladelogik geschaltet besteht die 
gefertigten Schaltungsplatine seitens der Ladelogik so gleichermaBen ais Schreib-Lese-Speicher oder auch nur 
angesteuert und konfiguriert beziehungsweise pro- ais Lese-Speicher realisiert sein konnen. Der soweit be- 
grammiert werden, daB diese zweiunddreiBig Zellen ein 65 schriebenen Rechnerstruktur ist die Ladelogik 30 zu- 
8-Bit-AddiererbBden. beziehungsweise ubergeordnet mittels der die inte- 
rn der Darstellung nach Fig. 13 ist fiber eine strich- grierten Schaltkreise (DatenfluBprozessor) 20 program- 
punktierte Umrahmung ein SUBMACRO ")C zeichne- miert und konfiguriert und vernetzt werden. 
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Die Ladelogik 30 baut beispielsweise auf einem i (gemaB Rg.9) zur Bfldung der AdreBdaten, wobei 
Transputer 31, d. h. einem Prozessor mit mikrocodier- diese MACROs 1 wie folgt geschaltet sind: Uber jeweils 
tem Befehlssatz auf, dent seinerseits ein Speicher 32 einen Eingang werden die zu verknupfenden Adressen 
zugeordnet ist Die Verbindung zwischen dem Transpu- fur Ac Q, zugefuhrt Diese Adressen werden mit den 
ter 31 und dem DatenfiuBprozessor basiert auf einer 5 Ausgangssignalen eines Zahlers 47 addiert und mit der 
SchnittsteUe 33 fur die sogenannten Ladedaten, d. h. die Statemachine 45 so verknQpft, daB am Ausgang die neue 
Daten die den DatenfiuBprozessor aufgabenspezifisch Zieladresse ansteht Der Zahler 47 und der Komparator 
programmieren und konfigurieren und einer Schnitt- 48 haben dabei die Aufgabe sicherzustellen, daB jeweils 
stelle 34 fQr den bereits genannten Rechnerspeicber 22, die riebtigen Summanden verknupft werden und daB 
d. h. den Shared-Memory-Speicher. 10 jeweils am Ende der Zahlenreihen, d. h. bei n = 9 abge- 

Die in Rg. 14 dargestellte Struktur stellt so einen brocben wird. Ist die Addition vollendet, so wird in der 
kompletten Reehner dar, der uber die Ladelogik 30 je- Zustandsmaschine 45 einSTOP-Signal generiert und die 
weils fall- beziehungsweise aufgabenspezifiscb pro- Schaltung passiv geschaltet Ebenso kann das STOP-Si- 
grammiert und konfiguriert werden kann. Der Vollstan- gnal als Eingangssignal fur eine Synchronisations-Schal- 
digkeit haiber sei noch angemerkt, daB — wie in Verbin- 15 tung verwenden werden, indem die Synchronisationslo- 
dung mit der Ladelogik 30 uber Pfeile angedeutet - gik anhand dieses Signals erkennen kann, daB die Ge- 
mehrere dieser Reehner vernetzt, d. h. miteinander ge- samtfunktion "Addieren" gemaB dem nachf olgend be- 
koppelt werden konnen. schriebenen ML1 Programm beendet ist und die MA- 

Ein weiteres Ausfuhrungsbeispiel einer Reehner- CROs somit durch Neue ersetzt werden kdnnen (zum 
struktur ist in Fig. 15 dargestellt Im Unterschied zu 20 Beispiel konnte STOP das Signal SyncS seinX 
Fig. 14 sind dabei neben den lokalen BUS-Leitungen Der Zeitablauf in der 45 (STATEMACHINE) laBt 
zwischen den benachbarten integrierten Schaltkreisen sich dabei wie folgt darstellen, wobei noch anzumerken 
20 noch ftbergeordnete zentrale BUS-Leitungen 23 vor- ist, daB in der Zustandsmaschine 45 eine Verzogerungs- 
gesehen, um zum Beispiel speziftsche Ein- beziehungs- zeit T fin Form von Taktzyklen) zwischen der AdreBge- 
weise Ausgangsprobleme losen zu konnen. Auch der 25 nerierungunddemDatenerhaltimplementiertist: 
Speicher 22 (Shared-Memory) ist uber zentrale BUS- 
Leitungen 23 mit den integrierten Schaltkreisen 20 ver- - Im Zyklus 1 wird jeweils der Zahler 47 um 1 
bunden, und zwar wie dargestellt jeweils mit Gruppen erhdht und im Komparator 48 wird gepruft, ob n > 
dieser integrierten Schaltkreise. Die in Rg. 15 darge- 9 erreicht ist; synchron zu diesen Operationen wer- 
steflte Rechnerstruktur weist die gleiche Ladelogik 30 30 den die Adressen fur A, B, C berechnet; 
auf,wiesieanhandvonRg.l4erlautertwurde. - im Zyklus fT + 1) werden die Summanden A, B 

In Verbindung mit Rg. 20a soil eine aus erfindungsge- ausgelesen und addiert; 

maBen DatenfluBprozessoren aufgebaute Additions- - im Zyklus (T + 2) wird die Summe C abgespei- 

schaltung eriautert werdea Ausgegangen wird von zwei chert 
Zahlenreihen An und B n fur samtliche n zwischen 0 und 35 

9; die Aufgabe besteht darin, die Summe Q - Ai + Bi Mit anderen Worten heiBt dies, daB die Operanons- 
zu bilden, wobei der Index i die Werte 0 <= n < 9 schleife und die eigentliche Addition gerade (T + 2) 
annehmen kann. Taktzyklen erfordert Im allgemeinen sind fQr T 2.. 3 

Bezugnehmend auf die Darstellung nach Rg. 20a ist Takte erforderfich, so daB ver^ichen mit den herkdmm- 
die Zahlenreihe An in einem ersten Soeicher RAMI 40 lichen Prozessoren (CPU), die im allgemeinen 50 bis 
abgespeichert und zwar zum Beispiel ab einer Speicher- mehrere 100 Taktzyklen bedingen, eine ganz wesenth- 
adresse 1000 h; die Zahlenreihe B 0 ist in einem Speicher che Rechenzeit-Reduzierung moglich wird 
RAM2 an einer Speicheradresse OdfaOh abgespeichert; Die anhand von Rg. 20 aufgezeigte Configuration 
die Summe Q, wird in den RAMI eingeschrieben und soli im folgenden uber eine hypothetische MACRO- 
zwarunterderAdressetOOah. 45 Sprache ML1 nochmals eriautert werden: 

Es ist ein weiterer Zahler 49 zugeschaltet, der ledig- Es existieren die Zahlenreihen An und B n 
lich die einzelnen durch die Steuerschaltung freigegebe- n;0«n< =9 

nen Taktzyklen hochzahlt Dies soil im Weiteren zur Es sollen die Summen Ci^Ai + BimitieN gebildet 

Verdeutlichung der Umkonfigurierbarkeit einzelner werden. 

MACROs ohne Beeinflussung der an der Umkonfigurie- 50 const n = 9; 

rung nicht beteiligten MACROs cUenea array A[n] in RAM[1] at 1000 h; 

Rg.20a zeigt zunachst die eigentliche Additions- array B[n] in RAM[2] at OdfaOh; 
schaltung 40, die aus einem ersten Register 41 zur Auf- array q>] in RAM[1] at lOOah; 
nahme der Zahlenreihe A a und einem zweiten Register for i = 0 to n with (A[iJ ^TJ, C[i]) 
42 zur Aufnahme der Zahlenreihe B a besteht Den bei- 55 Al; 
den Registern 41/42 ist ein 8-Bit-Addierer entsprechend C = Al » A + B; 
dem in Rg. 9 dargestellten MACRO 1 nachgeschaltet next; 

Der Ausgang des MACRO 1 fuhrt uber eine Treiber- RAM[l]istder l.Speicherblock 
schaltung 43 zuruck zum Speicher RAMI. Die Takt- RAM[2]istderZSpeicherblock 
beziehungsweise Zeitsteuerung der Additionsschaltung 60 at folgt die Basisadresse der Arrays 
40 erfolgt Gber eine von einem Taktgenerator T ange- for ist der Schleifenbeginn 
steuerte Ziistaiuismaschine (STATEMACHINE) 45, die next ist das Schleif enende 

mit den Registern 41, 42 und der Treiberschaltung 43 with ( ) folgen die Variablen, deren Adressen durch die 
verbundenist ZaliWariable i bestimmt werden 

Die Additionsschaltung 40 wird funktional durch eine 65 T folgt die Verzogerungszeit fur eine Sutemachine in 
AdreBschaltung 46 zur Generierung der AdreBdaten fur Taktzyklen m 
die abzuspekhernden Additionsergebnisse erganzt Die Das Traiing der Zusma^inascbine (Statemachine) stent 
AdreBschaltung 46 besteht ihrerseits aus drei MACROs demnach folgendermaBen aus: 
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Zyklus Aktivitat gebildet werden. 

1 Zahier erhohen, Vergleich auf > 9 (ja => Abbrucb) path D; 
und constn = 9; 

Adressen fur A, B,Q berechnen array A[n] in RAM[1] at 1000 h 

T + 1 A, B, holen und addieren 5 array B[n] in RAM[2] at Odf aOh 

T + 2 Nach C speichern array C[n] in RAM[1] at lOOah 

Das heiBt — wie bcreits erwahnt - die Schieife und die for i = 0 to n with(ApJ BpJCJTD 
Addition bendtigen gerade einmal T + 2 Taktzyklen. Al ; 

Fig. 20b zeigt den groben Aufbau der einzeinen D- Al « A+B; 
Funktionen (MACROs) in einem eifmdungsgemaBen io C = Al = DxB; 
DFP. Die MACROs sind in ihrer etwaigen Lage und next; 

GrdBe eingezeichnet und mit den anhand von Fig. 20a path D definiert einen mternen nicht aus den DFP 
eriauterten entsprechenden Nummern versehen. herausgefuhrten Doppelpfad. Die Operation benotigt 

Fig. 20c zeigt den groben Aufbau der einzeinen Funk- wegen einem zusatziichen Al einen Taktzyklus mehr als 
tionen auf die RAM-Bldcke 1 und 2: Die Summanden !5 vorher, ist insgesamt jedoch schneller als die beiden 
werden nacheinander in aufsteigender Reihenfolge aus obigen Programme in Folge ausgefuhrt, da zum einen 
den RAM-Bldcken 1 und 2 ab Adresse 1000 h bezie- die Schieife nur einmal durchlaufen wird, zum zweiten 
hungsweise OdfaOh gelesen und in RAM-Block 1 ab nicht umgeladen wird 

Adresse lOOah gespeichert. Zudem sind die Zahier 47 Prinzipiefl konnte das Programm auch so formuhert 
und 49 gegeben, beide zahlen wahrend des Ablaufs der 20 werden: 
Schaltung von 0 bis 9. const n —9; 

Nach Beendigung des beschriebenen Programms soli array A[n] in RAM[1] at 1000 h 
em neues Programm geladen werden, das die Ergebnis- array B[n] in RAM[2] at OdfaOh 
se weiterverwertet Die Umladung soil zur Laufzeit er- array C[n] in RAM[1] at lOOah 
folgen. Das Programm ist im Folgenden gegeben: 25 for i = 0 to n with (ApJ Bp], CpD 

Es existieren die Zahlenreihen A n und Bn, wobei Ao Al; 
durch das Ergebnis Cn des vorher ausgefuhrten Pro- C - A2 - (A+B)x B; 

eramms gegeben ist: next ; . . . 

n:0 n < - 9 sind * Gatterlaufzeiten des Addierers und des Mul- 

Es soflen die Produkte Q = AixBimiti€N gebildet 30 tiplizierers zusammen kleiner als ein Taktzyklus, kann 
werdejL die Operation (A+B)xB auch in einem Taktzyklus 

constn = 9 durchgefuhrt werden, was zu einer weiteren erhebli- 

array A[n] in RAM(1] at lOOah chen Gescfawindigkeitssteigerung fOhrt: 

arrayB[n]inRAM[2]at0dfa0h constn - 9; 

array Cfn] in RAM[1] at 1015 h 35 array A[n]mRAM[l atlOOOh 

fori^OtonwithCAOlBtijqjO) array B[n] in RANJ2] at OdfaOh 

Al- arrayC[n]inRAM[l]atl00ah 
C = A1 =AxB; fori«Otonwith(AH,B[ijqi]) 
next 

Die Beschreibung der einzeinen Befehle ist bereits 40 C = Al = (A+B)xB; 
bekannt, x symbolisiert die Multiplikation. next; . 

Die MACRO-Struktur ist in Fig. 21a beschrieben, Anhand von Fig. 8 soli em einf aches Beispiel eines 
Fig. 21b gibt in bekannter Weise die Lage und GrdBe ZeUenaufbaus erlautert werden. Die Zelle 10 umfaBt 
der einzeinen MACROs auf dem Chip an, besonders zu zum Beispiel ein UND-Glied 51, ein ODER-Glied 52, em 
beachten ist dieGrofie des Multiplizierers 2 in Vergleich 45 XOR-Glied 53, einen Inverter 54 sowie erne Register- 
zu Addierer 1 aus Fig. 20b. In Fig. 21c ist erneut die zelle 55. Die Zelle 10 weist daruberhinaus eingangssemg 
Auswirkung der Funktion auf den Speicher aufgezeigt, zwei Multiplexer 56, 57 mit (den sechzehn Emgangen 
Zahier 47 zahlt erneut von 0 bis 9, d. h. er wird beim der Zelle entsprechend Fig. 1) zum Beispielje seckzehn 
Nachladen der MACROs zurQckgesetzt Emgangsanschlussen INI, IN2 auL Uber diesen 

Besonders zu beachten ist der Zahier 49. Angenom- 50 (16 : 1)-Multipiexer 56/57 werden jeweds die ^den ge- 
men, das Umladen der MACROs betragt lOTaktzyklea nannten Iogischen GUedern UND, ODER, XOR 51. .53 
Dann ISuft der Zahier 49 von 9 auf 19, da der Baustein zuzxifuhrenden Daten ausgewahlt Diese Iogischen Glie- 
dynamisch umgeladen wird, d. h. nur die umzuladenden der sind ausgangsseitig mit einem (3 : ^Multiplexer 58 
Teile werden gestoppt, der Rest arbeitet weiter. Das gekoppelt, der seinerseits mit dem Eingang des Inver- 
mhrt nun dazu, daB der Zahier wahrend des Programm- 55 ters 54, einem Eingang der Registerzelle 55 und einem 
ablaufs von 19 auf 29 hochlauft (Hiermit soil das dyna- weiteren (3 : 16>Multiplexer 59 gekoppelt 1st. Der letzt- 
mische unabhangige Umladen demonstriert werden, in genannte Multiplexer 59 ist zusatzhch mit dem Ausgang 
jedem bisher bekannten Baustein wurde der Zahier er- des Inverters 54 und einem Ausgang der Remsterzelle 
neut von 0 auf 9 lauf en, da er zuruckgesetzt wird). 55 verbunden und gibt das Ausgangssignal OUT ab. 

Bei naherer Betrachtung des Problems steUt skh die eo Der Vollstandigkeit halber sei angemerkt, daB die Re- 
Frage, warum nicht beide Operationen, die Addition gisterzelle 55 mit einem Reset-Eingang R und einem 
und die Multiplikation in einem Zyklus durchgefuhrt Takteingang gekoppelt ist 

werden, also die Operation: Dem im vorstehenden eriauterten ZeUenaufbau, d. h. 

Es existieren die Zahlenreihen A a und B* wobei An der Zelle 10 ist nun eine Ladeiogik 30 ubergeordnet, die 
durch das Ergebnis von Co des vorher ausgefuhrten 65 mit den Multiplexera 56, 57, 58 und 59 verbunden 1st und 
Programms gegeben ist: diese den gewfinschten Funktionen entsprechend an- 

n-0 <= n < =9 steuert. 
Es sollen die Produkte Ci =* (Ai+BOxBj mit i e N SoUen zum Beispiel die Signale A2 mit B5 verrundet 
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werden, so werden die Multiplexer 56, 57 den Leitungen 
"ZWET beziehungsweise "FONF" entsprechend aktiv 
geschaltet; die Summanden gelangen dann zum UND- 
Glied 51 und werden bei entsprechender Akthrierung 
der Multiplexer 58, 59 am Ausgang OUT abgegeben. 5 
Soli zum Beispiel eine NAND-Verknupfung durchge- 
fuhrt werden, so schaitet der Multiplexer 58 zum Inver- 
ter 54 und am Ausgang OUT steht dann das negierte 
UND-Ergebnis an. 

10 

Patentanspruche 

1. Verfahren zum Betrieb einer Datenverarbei- 
tungseinrichtung mit programmier- und konflgu- 
rierbarer Zellstruktur, wobei die Datenverarbei- 15 
tungseinricbtung eine Zellmatrix aus einer Vielzahl 
orthogonal zueinander angeordneter, bomogen 
strukturierter Zellen, welche in ihrer Funktion und 
Vernetzung durch eine Ladelogik frei program- 
mierbar sind, en thai t, dadurch gekennzeichnet, 20 
dafi 

a) ein Konfigurationsprogramm, bestehend 
aus einer Foige von Ladelogik-Befehlen, die 
jeweils die Funktion und Vernetzung der ein- 
zelnen Zellen angeben, so dafi sich aus einer 25 
Tea f olge eine spezielle Konfiguration mit spe- 
zieller(en) Anwendung(en) ergibt, vorhanden 
ist, auf das die Ladelogik (30) Zugriff hat 
(Fig. 3, Fig. 8, Fig. 14, Fig. 1 5) und das von ihr 
ausgefuhrt wird, 30 

b) zunachst durch eine bestimmte Anzahi von 
Ladelogik-Befehlen eine Konfiguration 
(Fig. 20b) mit spezieller(en) Anwendung(en), 
mittels der Ladelogik (30) zu Beginn als Start- 
konfigurationmderZell-Matrix(Fig.2,Fig.3) 35 
eingestelltwird, 

c) durch eine Statemachine (45) oder einen 
Komparator (48) die Beendigung der Durch- 
fuhrung einer Anwendung einer oder mehre- 
rer Zellen erkannt wird, ao 

d) durch die Erkennung eine Ruckmeidung an 
die Ladelo^k (30) erfolgt, die die Programm- 
abarbeitung des Konfiguratwnsprogramms 
mit einer anderen Teilfolge (Fig. 21b, Fig. 22b) 
fortsetzt, welche nur Zellen umkonfiguriert, al- 45 
so neu erstellt, die die Durchfuhrung ihrer 
Funktion fur die aktuelle Anwendung bereits 
beendet haben oder nicht benotigt werden, so 
daB die Abarbeitung der Datenstrdme der an 
der aktuellen Configuration noch beteiligten, 50 
parallel (z. B. Register 41, 42) oder gepipelined 
(z. E Fig. 22a, Summierer 141 und Multiplizie- 
rer 149) arbeitenden Zellen, die sich noch in 
der Durchfuhrung ihrer Anwendung beflnden, 
nicht gestdrt wird. 55 

2. Verfahren zum Betrieb einer Datenverarbei- 
tungseinrichtung nach Anspruch 1, dadurch ge- 
kennzeichnet, daB durch eine Priorisierungs-Logik 
(z. B. Fig. 19) das Umkonfigurieren der unabhangi- 
gen parallel oder gepipelined arbeitenden Zellen, 60 
einer Funktion oder Konfiguration in der optima- 
len richtigen Reihenfolge uber eine Ruckmeidung 
an die Ladelogik sichers tellt wird. 

3. Verfahren zum Betrieb einer Datenverarbei- 
tnngseinrichtung nach einem der AnsprOche 1 oder 65 
2, dadurch gekennzeichnet, daB die Operanden aus 
raehreren, beliebig vielen unabhangig adressierten 
und gesteuerten Speichern (Fig. 20a, Fig. 20c; 
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RAMI, RAM2) bezogen werden und das Ergebnis 
in einen dieser Speicher (Fig. 20a, Fig. 20c; RAMI) 
oder einen davon unabhangigen oder eine separa- 
ten Datenkanal (Fig. 14, Fig. 15; IO) ausgegeben 
wird. 

4. Verfahren zum Betrieb einer Datenverarbei- 
tungseinrichtung nach einem der Anspruche 1 bis 3, 
dadurch gekennzeichnet, daB zur besseren Ausla- 
stung der Vernetzung von Zellen, Busse mit Hilfe 
von zwischengeschalteten Schaltern (Fig. 18; Trei- 
ber) Verwendung fmden, so daB Busse in unabhan- 
gige Abschnitte aufgeteilt werden konnea 
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